讲座回顾 _ 揭开AI生成图像的面纱

复旦大学信息科学与工程学院青年讲师团讲师黄代鑫于2024年5月18日下午14:00-15:30在上海图书馆东馆开展了主题为“揭开AI生成图像的面纱”的讲座。

AI 生成图像技术的出现，为人们提供了更多的创造性工具和可能性。在艺术领域，AI生成图像技术为艺术家和设计师带来了全新的创作方式。通过训练艺术风格转换模型，艺术家可以将不同风格的绘画相互转换，创作出独特的艺术作品。此外，AI生成图像技术还可以帮助艺术家快速生成概念草图，探索不同的创作可能性，从而激发更多的创意和想象力。AI生成图像技术为人们提供了更多的创造性工具和可能性，为诸多领域带来了前所未有的创新和发展机遇。

在本次讲座中，主讲嘉宾复旦大学信息科学与工程学院青年讲师团讲师黄代鑫主要介绍了当下主流的图像生成模型原理，并分享了一些实用的AI工具，帮助大家认识AI，学习AI和使用AI。以ChatGPT为起点，人工智能技术在过去一年内实现了飞速发展，从文本生成到图像生成再到Sora的视频生成，AI正朝着模拟真实物理世界的方向不断进化。在图片生成任务中，以Stable Diffusion为代表的多模态模型可以依据文字描述生成图像，利用该模型可以实现广告插图的设计、辅助电影制作和人脸美化等任务，提高我们的生产力。了解AI图像生成模型的原理，有助于我们使用AI工具和学习AI技术。

黄老师利用模型这一概念作为讲座的切入点，通过人类历史中很多重要模型，例如：日心说、万有引力定律、大陆漂移假说，以及我们近代的欧姆定律、晶体管等电路模型，引出了本次讲座的主人公Transformer、Diffusion等神经网络模型。

接着讲师介绍了三种图像生成模型，分别是：GAN（Generative Adversarial Network）模型、VAE（Variational Autoencoder）模型和扩散模型。同时也讲到了文字和图像结合的开源多模态模型Stable Diffusion、由小红书提出的一种基于人脸面部特征构建的图像生成模型InstantID和由加州伯克利大学提出的一种加速Stable Diffusion处理视频速度的模型StreamDiffusion。帮助各位观众去了解AI生成图像的原理。扩散推理加速、图片质量提升和多模态特征融合。

然后黄老师向观众介绍了AI视频的生成，主要介绍了由OpenAI开发的文生视频大模型Sora，它能够根据语言描述生成高清的视频，并且生成的视频内容十分逼真。同时也播放了三个由Sora生成的视频供观众们欣赏，收获了良好的反响。

最后讲师也与观众们分享了AI工具，分别有：开源的免费图像生成工具Stable Diffusion Webui，里面包含了文生图、图生图、模型微调等功能，是一个十分强大的开源软件。模型网站，专注于AI生图的哩布哩布ai；好用免费的ChatGPT助手—Bito。同时讲师也分享了AI学习的资料推荐，例如：书籍《模型思维》——龚才春、《数学之美》——吴军等。HuggingFace中的学习板块，CSDN、知乎中的部分优质文章等。CVPR、NIPS、ICCV等顶级会议论文和国际著名开源团队的文章等。

本次活动不仅仅使听众们更加了解了AI生成图像这一技术，更是上海图书馆与复旦大学信息学校青年讲师团的一次友好合作，为讲师团今后的课程展示和成果产出提供了新的思路和可能性。

共青团复旦大学信息科学与工程学院委员会

复旦大学信息科学与工程学院学生会

供稿 | 青讲团胡家鸣

编辑 | 宣传部任卓涵

2024.5.24